Inteligencia Artificial

Así es la nueva herramienta de Microsoft que necesitas para imitar la voz de un persona en tres segundos

Comisión europea microsoft
La Comisión Europea investigará por problemas de competencia a Microsoft al vincular 'Teams' y 'Office'
Nacho Grosso
  • Nacho Grosso
  • Cádiz (1973) Redactor y editor especializado en tecnología. Escribiendo profesionalmente desde 2017 para medios de difusión y blogs en español.

La Inteligencia Artificial no deja de depararnos sorpresas. Microsoft ha sido capaz de desarrollar una herramienta que con solo tres segundos de escucha de una voz es capaz de reproducirla con total naturalidad. Esta herramienta lleva el nombre de VALL-E, y puede suponer un antes y un después a la hora de ofrecer un producto versátil, creíble y que tenga bastantes aplicaciones. Lo imposible ya está aquí, no te pierdas la tecnología desarrollada por Microsoft.

VALL-E, lo último en IA aplicado a voces

A decir verdad, se trata de una herramienta de esas que dan un poco de vértigo. Ha sido construida mediante 60.000 horas de voces en inglés, siendo esta librería aportada por Meta, y que a su vez proviene de Librivox, una gran biblioteca de audiolibros de carácter publico. Lo más sorprendente de esta herramienta es que solamente necesita tres segundos de escuchar una voz para generar contenido exactamente con ese tono y esa manera de hablar. Incluso podrías clonar una voz de un audio de cualquier persona que te haya enviado por WhatsApp. Sí, amigos, el futuro ya está aquí y la inteligencia artificial está haciendo posible gran cantidad de cosas impensables hace solo unos años.

De momento, esta herramienta no ha sido lanzado de manera pública, y las muestras que hay solamente están disponibles en inglés. Pero no cabe duda de la importancia del español, por lo que tampoco tardaremos en ver esta herramienta disponible en nuestra lengua.

VALL-E

Hay muchas cosas de VALL-E que dan verdadero pavor. Por ejemplo, que con solo tres segundos ya haya material suficiente para producir esa voz. Pero algo que es realmente increíble es que es capaz de reproducirse la voz mediante inteligencia artificial según las condiciones de la muestra. Pongamos por ejemplo que la persona que habla en la muestra está feliz y contenta, la producción que se va a generar también tiene esas características. Puedes echar un vistazo en la web que tienes a tu disposición con los ejemplos.

La profusión de IA en nuestras vidas

La inteligencia artificial ya no es algo de ciencia ficción, sino una realidad que cada vez tiene aplicaciones más evidentes. Una de ellas pudimos verla con la recreación de fotografías de una persona en diferentes ámbitos históricos. El nivel de perfección es muy alto, y la propuesta de Microsoft no deja de ser un paso adelante en este sentido. Esto no ha hecho más que comenzar, por lo que la inteligencia artificial ya se ha tornado en una propuesta realista.

Lo último en Tecnología

Últimas noticias